您的当前位置:首页 >探索 >肖战粉丝的人群画像:爬虫逻辑分成三步 正文

肖战粉丝的人群画像:爬虫逻辑分成三步

时间:2024-11-25 10:04:33 来源:网络整理编辑:探索

核心提示

前一阵子,由于肖战的“227风波”微博和朋友圈都被刷屏,起因在与肖战的粉丝发觉在AO3作品库平台收录关于肖战的同人作品,认为该部作品影响了肖战的形象,遂向有关部门举报,最终告知著名同人网站A03Arc qq赞免费刷赞在线

前一阵子,肖战像爬由于肖战的粉丝“227风波”微博和朋友圈都被刷屏,起因在与肖战的群画qq赞免费刷赞在线粉丝发觉在AO3作品库平台收录关于肖战的同人作品,认为该部作品影响了肖战的虫逻成步形象,遂向有关部门举报,辑分最终告知著名同人网站A03(Archive of our own)作品库难以被访问。肖战像爬

这也对爱好同人作品的粉丝读者与作者都引起了不可逆转的伤害。随即微博粉丝链接,群画他们联合其他路人便组成227大团结,虫逻成步qq赞免费刷赞在线共同谴责肖战及其粉丝,辑分一时间与肖战紧密联系的肖战像爬品牌店家纷纷罢免其代言人与品牌形象大使。

小编并不是粉丝肖战的粉丝,对其主演的群画作品看的也不多,这次就从爬虫以及数据可视化的虫逻成步角度(数据来源是微博上肖战的评论粉丝)来为你们呈现肖战粉丝的人群画像。

爬虫逻辑分成三步:

01

采集肖战的辑分所有微博

首先获取名星发的所有的微博ID,在有了这种ID以后,便可以拼接成了微博评论的第一页的URL

另外在翻页的操作时,微博评论的下一页链接的参数一般在本页的末尾,所以在每次爬取时,也要记得抓取下一页链接的重要参数

02

采集肖战微博下边的所有评论粉丝ID

由于时间有限,小编就没有做转发与点赞粉丝ID获取的开发,但是原理类似。评论粉丝的ID获取相对容易,在xpath的指引之下,

03

爬取粉丝的微博主页,并进行数据清洗

用户基本信息页面的链接一般为: “用户id/info”,所以我们只要获取用户的id就可以领到他的公开基本信息

当然每位用户的设置不尽相同,一般来说,公开信息中包括,所在地、性别、生日以及标签等等。

粉丝的人群画像

01

粉丝的地域分布

从肖战粉丝的地域分布来看,广东省、江苏、四川以及浙江省这四个省份是其粉丝最为集中的四个省份,小编将粉丝的地域分布投射到完整的地图上,我们可以发觉的是中部也有几个省份,比如广西、湖南两省以及福建,也有不少粉丝喜爱着肖战。

02

粉丝的年纪分布与天蝎

从粉丝的年纪分布来看,大多数的粉丝年纪都集中在20岁以下的90后,以及20-25岁的80后的女人,而在30岁以上的粉丝群体则占到了极少数,

抛开年纪,我们看天秤,天秤座的粉丝是最多的占到了15%,而天蝎座与射手座的粉丝数目高踞其次,接近有9%的比重。不同的年纪阶段以及不同的天秤,对应着不同的性格特点与喜好,或许店家品牌方在做广告以及市场营销的时侯可以针对自己的目标人群精准推销以提高产品的销量

03

粉丝的标签

从粉丝自己选择属于自己的标签来看微博粉丝链接,她们爱美食,是一个典型的老饕;她们热爱旅游,想要去看一下外边的世界;她们其实也比较的宅,空余的时间会选择宅在家里,听听歌,看看影片与漫画;她们中的大多数都是90后甚至是80后的中学生,喜欢自由与无拘无束的生活。

从肖战的“227”事件当中,我们就能看出的是整个圈子当中存在的畸形文化,粉丝在追星过程当中,对粉的人与事都饱含了太多的情感,他们希望自己的看法与观点才能被别人所接受与认同,所以在情绪激增之时,难免会有过激的语言与谈吐。同时在互联网的海量信息之下,年轻又不谙世事的粉丝又很难做到理智的剖析与判定。

但是,处于这个万物联网时代下的圈层之中,因为某种情感投入和热爱而集聚到一起的,喜欢参与又渴求被认可的,希望他人鸦雀无声的,又何止是那些追逐名星的狂热粉丝呢?

- DataCastle -